本文实现的元刷是从微博热搜榜中采用正则表达式获取微博热搜词及其链接并储存成list方式的功能。袁记短视频热门业务教程网
几个注意事项:
1微博加入了“25”混淆进行反爬虫,个赞qq刷赞宝在线以热搜词'迪丽热巴关注杨幂'为例,微博qq刷赞宝在线获取到的冲关转码前的热搜词是:
%25E8%25BF%25AA%25E4%25B8%25BD%25E7%2583%25AD%25E5%25B7%25B4%25E7%25B2%2589%25E4%25B8%259D%2B%25E6%259D%25A8%25E5%25B9%2582
注意不可以直接replace('25',''),由于热搜词中本身就可能包含‘25’这个数,注链因而采用replace('%25','%')进行替换。元刷替换后疗效:
%E8%BF%AA%E4%B8%BD%E7%83%AD%E5%B7%B4%E7%B2%89%E4%B8%9D%2B%E6%9D%A8%E5%B9%82
2热搜词中常包括空格,个赞而url中会手动将空格(%20)转为+号(%2B)微博冲关注链接微博冲关注链接,微博因而须要执行.replace('+',''),冲关否则直接从url中提取会造成'迪丽热巴关注杨幂'弄成'迪丽热巴关注+杨幂'
3urllib.parse.unquote(resou_keyword,encoding="utf8")可以把看不懂的注链%E8%BF%AA%E4...转为'迪丽热巴关注杨幂'
直接上代码:
import re, urllib, requests# 获取微博实时热搜榜def get
袁记短视频热门业务教程网